導(dǎo)讀:Mozilla希望讓初創(chuàng)公司,研究人員和業(yè)余愛好者更容易構(gòu)建支持語音的應(yīng)用,服務(wù)和設(shè)備。為此,它今天發(fā)布了最新版本的Common Voice,這是一個(gè)開源的語音數(shù)據(jù)集,現(xiàn)在包括來自42000名貢
發(fā)表日期:2019-09-02
文章編輯:興田科技
瀏覽次數(shù):10106
標(biāo)簽:
Mozilla希望讓初創(chuàng)公司,研究人員和業(yè)余愛好者更容易構(gòu)建支持語音的應(yīng)用,服務(wù)和設(shè)備。為此,它今天發(fā)布了最新版本的Common Voice,這是一個(gè)開源的語音數(shù)據(jù)集,現(xiàn)在包括來自42000名貢獻(xiàn)者超過1400小時(shí)的語音樣本,涵蓋18種語言,包括包括英語、法語、德語、荷蘭語、Hakha Chin語、世界語、波斯語、巴斯克語、西班牙語、中文、威爾士語和卡布語。
Mozilla聲稱,它是同類語言中最大的多語言數(shù)據(jù)集之一,比8個(gè)月前公開的普通語音語料庫(kù)要大得多,其中包含了2萬名英語志愿者500小時(shí),40萬份錄音,而且語料庫(kù)很快就會(huì)擴(kuò)大。該組織表示,70種語言的數(shù)據(jù)收集工作正在通過通用語音 網(wǎng)站 和移動(dòng)應(yīng)用程序積極開展。
通用語音可以集成到Deepspeech中,這是一套由Mozilla的機(jī)器學(xué)習(xí)小組維護(hù)的開源的語音到文本、文本到語音引擎和經(jīng)過培訓(xùn)的模型,它不僅包含語音片段,還包含一些自愿者提供的元數(shù)據(jù),這些元數(shù)據(jù)可用于培訓(xùn)語音引擎,如演講者的年齡、性別等等。
為了簡(jiǎn)化流程,Mozilla本周推出了一款改進(jìn)的Common Voice網(wǎng)絡(luò)工具,可以根據(jù)不同的提示進(jìn)行剪輯,還提供了用于查看、重新錄制和跳過剪輯的新控件。此外,它還推出了新的配置文件功能,允許用戶跨語言跟蹤進(jìn)度和指標(biāo),并添加人口統(tǒng)計(jì)信息。Mozilla表示,在接下來的幾個(gè)月里,它將嘗試不同的方法來通過社區(qū)努力和新的合作伙伴關(guān)系,增加數(shù)據(jù)的數(shù)量和質(zhì)量。最終目標(biāo)旨在為那些尋求構(gòu)建和使用語音技術(shù)的人提供更多更好的語音數(shù)據(jù)。
【來源:cnBeta.COM】
更多新聞
2023
在當(dāng)今競(jìng)爭(zhēng)激烈的商業(yè)環(huán)境中,一個(gè)專業(yè)的網(wǎng)站是贏得客戶信任和業(yè)務(wù)合作的重要工具。通過展示您的專業(yè)知識(shí)、經(jīng)驗(yàn)和成功案例,您可以向潛在客戶展示您在行業(yè)中的領(lǐng)導(dǎo)地位,從而獲得更多商機(jī)。
View details
2020
諾貝爾獎(jiǎng)獲得者朱的最新演講:如果你不開心,你可能會(huì)走錯(cuò)路!諾獎(jiǎng)得主朱棣文:我有一些人生經(jīng)驗(yàn),和年輕科學(xué)家分享論壇 演講第三屆世界頂尖科學(xué)家論壇特設(shè)科學(xué)態(tài)度大師講堂,由世界
View details
2023
引言在數(shù)字時(shí)代,網(wǎng)絡(luò)游戲的普及帶動(dòng)了大型游戲網(wǎng)站的建設(shè)需求。。然而,很多人都對(duì)大型游戲網(wǎng)站建設(shè)所需的...
View details
2023
怎么利用域名建設(shè)網(wǎng)站呢怎么利用域名建設(shè)網(wǎng)站呢:開發(fā)成功的網(wǎng)站的關(guān)鍵步驟無論是個(gè)人博客還是企業(yè)商店,建...
View details